在進入正題之前先來了解一下python在做資料分析與機器學習模型時常常會使用到的套件吧~
- Pandas(Panel Data):
描述:Pandas提供了DataFrame和Series等資料結構用於數據分析的工具。
使用場景:適用於執行資料的匯入、匯出、處理、轉換和計算統計分析等操作。
- NumPy(Numerical Python):
描述:NumPy提供了陣列和矩陣用於數學計算的工具。
使用場景:適用於執行科學計算,包含數學函數與線性代數等操作。
- SciPy(Scientific Python):
描述:SciPy提供了相較於NumPy更多高級的科學計算函數和統計工具。
使用場景:適用於執行積分、顯著性檢驗、訊號處理等高級數學。
- Matplotlib:
描述:Matplotlib提供了各種繪圖工具,用於創建靜態和互動式視覺化圖表。
使用場景:適用於呈現數據的視覺化等操作。
- Seaborn:
描述:Seaborn提供了相較於Matplotlib更高級的數據視覺化庫,以便快速創建各種統計圖表。
使用場景:適用於呈現數據的視覺化等操作。
- Sklearn(Scikit-Learn):
描述:Sklearn提供了各種機器學習演算法、預處理方法和模型評估工具。
使用場景:適用於需建立機器學習模型來進行數據分析、模型評估和預測等操作。
我們在做套件的匯入時,會使用"import [套件]"的語法將套件匯入進來,如果是想匯入套件內的特定函式的話,則使用 "from [套件] import [函式]"的語法來做匯入,舉例來說:
情境一、當我們想做機器學習模型時,會使用下列語法將套件匯入
import sklearn
情境二、當我們想做機器學習中的模型評估時,會使用下列語法將套件匯入:
from sklearn.metrics import classification_report